위키백과를 그래프로 시각화하여 찾아낸 놀라운 사실들
# 위키백과 데이터 시각화 및 네트워크 분석 결과 기록
이 문서는 영어 위키백과의 630만 개 문서와 그 사이를 잇는 2억 개의 링크를 시각화한 그래프를 통해, 데이터의 군집 구조, 문서 간 연결성, 그리고 네트워크 이론이 실제 정보 체계에서 어떻게 발현되는지를 상세히 분석한 내용을 담고 있습니다.
## 1. 그래프의 구성 요소와 군집 분석
* 색상의 의미와 군집 형성: 그래프의 각 색상은 알고리즘으로 결정된 군집을 나타냅니다. 군집은 전체 네트워크의 다른 문서들보다 서로 더 긴밀하게 연결된 문서 그룹을 의미합니다.
* 군집의 특징: 알고리즘은 총 44개의 군집을 감지했습니다. 이론적으로 서로 밀접하게 연결된 문서들은 내용적으로도 유사할 가능성이 높습니다.
* 3번 군집: 76만 개 이상의 문서가 포함되어 있으며, 주로 정치와 법률 관련 카테고리입니다. 미국 대통령 문서들이 여기에 속합니다.
* 5번 군집: **음악
2026. 1. 7. 16:27 | 댓글: 0